home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1994 March / Internet Info CD-ROM (Walnut Creek) (March 1994).iso / inet / internet-drafts / draft-nussbacher-hebrew-encoding-00.txt < prev    next >
Text File  |  1993-06-18  |  9KB  |  263 lines

  1.  
  2.  
  3. INTERNET-DRAFT
  4. Network Working Group                                      H. Nussbacher
  5.                                                 Israeli Inter-University
  6.                                                          Computer Center
  7.                                                              Y. Bourvine
  8.                                                        Hebrew University
  9.                                                                June 1993
  10.  
  11.  
  12.              Hebrew Character Encoding for Internet Messages
  13.  
  14.  
  15.      This document is an Internet-Draft.  Internet-Drafts are
  16.      working documents of the Internet Engineering Task Force
  17.      (IETF), its Areas, and its Working Groups.  Note that other
  18.      groups may also distribute working documents as
  19.      Internet-Drafts.
  20.  
  21.      Internet-Drafts are draft documents valid for a maximum of six
  22.      months.  Internet-Drafts may be updated, replaced, or obsoleted
  23.      by other documents at any time.  It is not appropriate to use
  24.      Internet-Drafts as reference material or to cite them other
  25.      than as a ``working draft'' or ``work in progress.''
  26.  
  27.      To learn the current status of any Internet-Draft, please check
  28.      the 1id-abstracts.txt listing contained in the Internet-Drafts
  29.      Shadow Directories on ds.internic.net, nic.nordu.net,
  30.      ftp.nisc.sri.com, or munnari.oz.au.
  31.  
  32. Status of this Memo
  33.  
  34.    This memo provides information for the Internet community.  It does
  35.    not specify an Internet standard.  Distribution of this memo is
  36.    unlimited.
  37.  
  38. Abstract
  39.  
  40.    This document describes the encoding used in electronic mail [RFC822]
  41.    for transferring Hebrew.  The standard devised makes use of MIME
  42.    [RFC1341] and ISO-8859-8.
  43.  
  44. Description
  45.  
  46.    All Hebrew text when transferred via e-mail must first be translated
  47.    into ISO-8859-8, and then encoded using either
  48.    Quoted-Printable (preferable) or Base64, as defined in MIME.
  49.  
  50.  
  51. Nussbacher & Bourvine        Expires December 16, 1993          [Page 1]
  52.  
  53. INTERNET DRAFT           Hebrew email encodings                June 1993
  54.  
  55.    The following table provides the four most common Hebrew encodings:
  56.  
  57.                  PC    IBM     PC     ISO
  58.      Hebrew                           8859-8
  59.      letter     8-bit         7-bit   8-bit
  60.                 Ascii  EBCDIC Ascii   Ascii
  61.      ---------- -----  ------ -----   ------
  62.      aleph       128     41    96     224
  63.      bet         129     42    97     225
  64.      gimel       130     43    98     226
  65.      daled       131     44    99     227
  66.      hey         132     45   100     228
  67.      vav         133     46   101     229
  68.      zayin       134     47   102     230
  69.      het         135     48   103     231
  70.      tet         136     49   104     232
  71.      yud         137     51   105     233
  72.      chaf sofit  138     52   106     234
  73.      chaf        139     53   107     235
  74.      lamed       140     54   108     236
  75.      mem sofit   141     55   109     237
  76.      mem         142     56   110     238
  77.      nun sofit   143     57   111     239
  78.      nun         144     58   112     240
  79.      samech      145     59   113     241
  80.      ayin        146     62   114     242
  81.      pey sofit   147     63   115     243
  82.      pey         148     64   116     244
  83.      zadik sofit 149     65   117     245
  84.      zadik       150     66   118     246
  85.      kuf         151     67   119     247
  86.      raish       152     68   120     248
  87.      shin        153     69   121     249
  88.      tuff        154     71   122     250
  89.  
  90.    Note: All values are in decimal ASCII except for the EBCDIC column
  91.    which is in hexadecimal.
  92.  
  93.    The directionality of the text is visual and not implicit.  That
  94.    means that the Hebrew text is encoded from left to right (even
  95.    though Hebrew text is entered right to left) and is transmitted
  96.    from left to right via the standard MIME mechanisms.  Future
  97.    MIME extensions (to the Content-type) will hopefully contain the
  98.    "direction=" option, at which point, it will be assumed that the
  99.    default is visual for Hebrew e-mail.
  100.  
  101.    All discussion regarding Hebrew in email, as well as discussions
  102.    of Hebrew in other TCP/IP protocols, is discussed in the
  103.    ilan-h@vm.tau.ac.il list.  To subscribe send mail to
  104.    listserv@vm.tau.ac.il with one line of text as follows:
  105.  
  106.    subscribe ilan-h firstname lastname
  107.  
  108. Nussbacher & Bourvine        Expires December 16, 1993          [Page 2]
  109.  
  110. INTERNET DRAFT           Hebrew email encodings                June 1993
  111.  
  112. MIME Considerations
  113.  
  114.    Mail that is sent that contains Hebrew must contain the following
  115.    minimum amount of MIME headers:
  116.  
  117.    MIME-Version: 1.0
  118.    Content-type: text/plain; charset=ISO-8859-8
  119.    Content-transfer-encoding: BASE64 | Quoted-Printable
  120.  
  121.    Users should keep their text to within 72 columns so as to allow
  122.    email quoting via the prefixing of each line with a ">".  Users
  123.    should also realize that not all MIME implementations handle email
  124.    quoting properly, so quoting email that contains Hebrew text may
  125.    lead to problems.
  126.  
  127.    In the future, when all email systems implement fully transparent
  128.    8-bit email as defined in RFC1425 and RFC1426 this standard will
  129.    become partially obsolete.  The "Content-type:" field will still
  130.    be necessary, as well as directionality (which might be implicit
  131.    for 8BIT, but is something for future discussion),  but the
  132.    "Content-transfer-encoding" will be altered to use 8BIT rather than
  133.    Base64 or Quoted-Printable.
  134.  
  135. Optional
  136.  
  137.    It is recommended, although not required, to support Hebrew encoding
  138.    in mail headers as specified in RFC 1342.  Specifically, the
  139.    Q-encoding format is to be the default method used for encoding
  140.    Hebrew in Internet mail headers and not the B-encoding method.
  141.  
  142. Caveats
  143.  
  144.    Within Israel there are in excess of 40 Listserv lists which will now
  145.    start using Hebrew for part of their conversations.  Normally,
  146.    Listserv will deliver mail from a distribution list with a
  147.    "shortened" header, one that does not include the extra MIME headers.
  148.    This will cause the MIME encoding to be left intact and the user
  149.    agent decoding software will not be able to interpret the mail.  Each
  150.    user is able to customize how Listserv delivers mail.  For lists
  151.    that contain Hebrew, users should send mail to Listserv with the
  152.    following command:
  153.  
  154.    set listname full
  155.  
  156.    where listname is the name of the list which the user wants full,
  157.    unabridged headers to appear.  This will update their private
  158.    entry and all subsequent mail from that list will be with full
  159.    RFC822 headers, including MIME headers.
  160.  
  161.    In addition, Listserv usually maintains automatic archives of
  162.    all postings to a list.  These archives, contained in the file
  163.    "listname LOGyymm", do not contain the MIME headers, so all
  164.    encoding information will be lost.  This is a limitation of the
  165.    Listserv software.
  166.  
  167. Nussbacher & Bourvine        Expires December 16, 1993          [Page 3]
  168.  
  169. INTERNET DRAFT           Hebrew email encodings                June 1993
  170.  
  171. Example
  172.  
  173.    Below is a short example of Quoted-Printable encoded Hebrew email:
  174.  
  175.    Date:         Sun, 06 Jun 93 15:25:35 IDT
  176.    From:         Hank Nussbacher <HANK@VM.BIU.AC.IL>
  177.    Subject:      Sample Hebrew mail
  178.    To:           Hank Nussbacher <Hank@BARILVM>,
  179.                  Yehavi Bourvine <yehavi@hujivms>
  180.    MIME-Version: 1.0
  181.    Content-Type: Text/plain; charset=ISO-8859-8
  182.    Content-Transfer-Encoding: QUOTED-PRINTABLE
  183.  
  184.    The end of this line contains Hebrew            .=EC=E0=F8=F9=E9 =F5=
  185.    =F8=E0=EE =ED=E5=EC=F9
  186.  
  187.  
  188.    Hank Nussbacher                                  =F8=EB=E1=F1=E5=
  189.    =F0 =F7=F0=E4
  190.  
  191. Acknowledgements
  192.  
  193.    Many thanks to Rafi Sadowsky and Nathaniel Borenstein for
  194.    all their help.
  195.  
  196. References
  197.  
  198.    [ISO-8859] Information Processing -- 8-bit Single-Byte Coded
  199.    Graphic Character Sets, Part 8: Latin/Hebrew alphabet, ISO 8859-8,
  200.    1988.
  201.  
  202.    [RFC822] Crocker, D., "Standard for the Format of ARPA Internet
  203.    Text Messages", STD 11, RFC 822, UDEL, August 1982.
  204.  
  205.    [RFC1341] Borenstein N., and N. Freed, "MIME (Multipurpose
  206.    Internet Mail Extensions): Mechanisms for Specifying and
  207.    Describing the Format of Internet Message Bodies", Bellcore,
  208.    Innosoft, June 1992.
  209.  
  210.    [RFC1342] Moore K., "Representation of Non-ASCII Text in Internet
  211.    Message Headers", University of Tennessee, June 1992.
  212.  
  213.    [RFC1425] Klensin, J., Freed N., Rose M., Stefferud E., Crocker D.,
  214.    "SMTP Service Extensions", February 1993.
  215.  
  216.    [RFC1426] Klensin, J., Freed N., Rose M., Stefferud E., Crocker D.,
  217.    "SMTP Service Extension for 8bit-MIME transport", February 1993.
  218.  
  219. Security Considerations
  220.  
  221.    Security issues are not discussed in this memo.
  222.  
  223.  
  224. Nussbacher & Bourvine        Expires December 16, 1993          [Page 4]
  225.  
  226. INTERNET DRAFT           Hebrew email encodings                June 1993
  227. Authors' Addresses
  228.  
  229.    Hank Nussbacher
  230.    Computer Center
  231.    Tel Aviv University
  232.    Ramat Aviv
  233.    Israel
  234.  
  235.    Fax: +972 3 6409118
  236.    Phone: +972 3 6408309
  237.    EMail: hank@vm.tau.ac.il
  238.  
  239.    Yehavi Bourvine
  240.    Computer Center
  241.    Hebrew University
  242.    Jerusalem
  243.    Israel
  244.  
  245.    Phone: +972 2 585684
  246.    Fax:   +972 2 527349
  247.    EMail: yehavi@vms.huji.ac.il
  248.  
  249.  
  250.  
  251.  
  252.  
  253.  
  254.  
  255.  
  256.  
  257.  
  258.  
  259.  
  260.  
  261.  
  262. Nussbacher & Bourvine        Expires December 16, 1993          [Page 5]
  263.